ディープラーニングを支える技術 2
https://gyazo.com/9f2cc0017630c039ca2f395948bfc4bf
2022
本作ではニューラルネットワークにおける大きな謎である「なぜ学習できるのか」「なぜ汎化するのか」にスポットを当て平易に解説。合わせて,将来的な革新の可能性を秘める二大トピックとして,「生成モデル」「深層強化学習」も詳しく取り上げます。そして,4つのテーマのもと,ディープラーニングや人工知能について課題を整理し,今後を考えていきます。 第0章 ディープラーニングとは何か
表現学習とタスク学習,本書解説の流れ
0.1 [速習]ディープラーニング
0.2 ニューラルネットワークの「学習」における大きな謎
0.3 これから学ぶ生成モデル
0.4 これから学ぶ強化学習
0.5 ディープラーニングと人工知能の課題とこれから
第1章 ディープラーニングの最適化
なぜ学習できるのか
1.1 最適化による学習
1.2 [概要]学習の効率化
1.4 学習率の自動調整
1.5 ハイパーパラメータの最適化
1.6 本章のまとめ
第2章 ディープラーニングの汎化
なぜ未知のデータをうまく予測できるのか
2.1 従来の汎化理論との矛盾
2.2 ニューラルネットワークと陰的正則化
2.3 明示的な正則化
2.4 本章のまとめ
3.1 生成モデル&深層生成モデルとは何か
ニューラルネットワークを使った潜在変数モデル
敵対的生成モデル
3.5 正規化フロー
3.7 本章のまとめ
第4章 深層強化学習 ディープラーニングと強化学習の融合
4.2 強化学習はどのような特徴を持つのか
4.3 最適な方策を直接求める
4.4 方策と価値
隣り合う時刻間の価値の関係を表す
オンラインでの方策の価値推定①
オンラインでの方策の価値推定②
4.8 予測から制御へ
問題のどこが変わるのか
基本の考え方とSARSA
人の振り見て我が振り直せ
4.11 関数近似
価値をパラメトリックモデルで近似する
方策の勾配を使って最適方策を学習する
ディープラーニングと強化学習の融合
コンピュータ囲碁での強化学習の適用例
4.16 本章のまとめ
第5章 これからのディープラーニングと人工知能
どのように発展していくか
5.1 学習手法の発展
5.2 人工知能と計算性能の関係
5.3 問題固有の知識をどう組み込むか
5.4 ディープラーニングの今後の課題
5.5 本章のまとめ